期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 不完备信息下基于切换推理证据网络的空中目标识别方法
王昱, 范子琳, 任田君, 姬晓飞
《计算机应用》唯一官方网站    2023, 43 (4): 1071-1078.   DOI: 10.11772/j.issn.1001-9081.2022020287
摘要201)   HTML7)    PDF (2178KB)(102)    PDF(mobile) (700KB)(6)    收藏

现有证据推理方法模型结构固定、信息处理方式和推理机制单一,难以适用于集结了不确定、错误甚至缺失等多种不完备信息环境下的目标识别。针对该问题,提出了一种切换推理证据网络(SR-EN)方法。首先,考虑证据节点删除等情况构建多模板网络模型;然后,分析各证据变量与目标类型的条件关联性以建立针对不完备信息的推理规则库;最后,提出基于三种证据输入及修正方式的智能化时空融合推理方法。与传统的证据网络(EN)以及EN与优劣解距离法(TOPSIS)等两种信息修正方法的结合方法相比,SR-EN能够在确保推理时效性的同时实现在多类随机性不完备信息下对空中目标的连续准确识别。实验结果表明,通过对各类不完备信息的有效识别,SR-EN能够实现连续推理过程中证据处理方式、网络结构和节点间融合规则的自适应切换。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 改进DeepLabv3+网络的图书书脊分割算法
姬晓飞, 张可心, 唐李荣
《计算机应用》唯一官方网站    2023, 43 (12): 3927-3932.   DOI: 10.11772/j.issn.1001-9081.2022121887
摘要298)   HTML5)    PDF (2364KB)(176)    收藏

图书定位是实现图书馆智能化发展的重要技术之一,精确的书脊分割算法成为实现该目标的一大难题。基于以上情况,提出改进DeepLabv3+网络的图书书脊分割算法,以解决图书密集排列、图书存在倾斜角度和书脊纹理极相似等情况下的书脊分割难点。首先,为了提取图书图像更密集的金字塔特征,将原始DeepLabv3+网络中的空洞金字塔池化(ASPP)替换为多空洞率、多尺度的DenseASPP (Dense Atrous Spatial Pyramid Pooling)模块;其次,针对原始DeepLabv3+网络对大长宽比的目标对象分割边界不敏感的问题,在DenseASPP模块的支路加入条形池化(SP)模块以增强书脊的长条形特征;最后,参考ViT (Vision Transformer)中的多头自注意(MHSA)机制,提出一种全局信息增强的自注意模块,以增强网络获取长距离特征的能力。将所提算法在开源数据库上进行对比测试,实验结果表明,与原始DeepLabv3+网络分割算法相比,所提算法在近竖直书脊数据库上的平均交并比(MIoU)提升了1.8个百分点;在倾斜书脊数据库上的MIoU提升了4.1个百分点,达到了93.3%。以上验证了所提算法实现了有一定倾斜角度的、密集的和大长宽比的书脊目标的精确分割。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于RGB和关节点数据融合模型的双人交互行为识别
姬晓飞, 秦琳琳, 王扬扬
计算机应用    2019, 39 (11): 3349-3354.   DOI: 10.11772/j.issn.1001-9081.2019040633
摘要473)      PDF (993KB)(344)    收藏
基于RGB视频序列的双人交互行为识别已经取得了重大进展,但因缺乏深度信息,对于复杂的交互动作识别不够准确。深度传感器(如微软Kinect)能够有效提高全身各关节点的跟踪精度,得到准确的人体运动及变化的三维关节点数据。依据RGB视频和关节点数据的各自特性,提出一种基于RGB和关节点数据双流信息融合的卷积神经网络(CNN)结构模型。首先,利用Vibe算法获得RGB视频在时间域的感兴趣区域,之后提取关键帧映射到RGB空间,以得到表示视频信息的时空图,并把图送入CNN提取特征;然后,在每帧关节点序列中构建矢量,以提取余弦距离(CD)和归一化幅值(NM)特征,将单帧中的余弦距离和关节点特征按照关节点序列的时间顺序连接,馈送入CNN学习更高级的时序特征;最后,将两种信息源的softmax识别概率矩阵进行融合,得到最终的识别结果。实验结果表明,将RGB视频信息和关节点信息结合可以有效地提高双人交互行为识别结果,在国际公开的SBU Kinect interaction数据库和NTU RGB+D数据库中分别达到92.55%和80.09%的识别率,证明了提出的模型对双人交互行为识别的有效性。
参考文献 | 相关文章 | 多维度评价
4. 基于关键帧特征库统计特征的双人交互行为识别
姬晓飞, 左鑫孟
计算机应用    2016, 36 (8): 2287-2291.   DOI: 10.11772/j.issn.1001-9081.2016.08.2287
摘要389)      PDF (765KB)(344)    收藏
针对双人交互行为识别算法中普遍存在的算法计算复杂度高、识别准确性低的问题,提出一种新的基于关键帧特征库统计特征的双人交互行为识别方法。首先,对预处理后的交互视频分别提取全局GIST和分区域方向梯度直方图(HOG)特征。然后,采用 k-means聚类算法对每类动作训练视频的所有帧的特征表示进行聚类,得到若干个近似描述同类动作视频的关键帧特征,构造出训练动作类别对应的关键帧特征库;同时,根据相似性度量统计出特征库中各个关键帧在交互视频中出现的频率,得到一个动作视频的统计直方图特征表示。最后,利用训练后的直方图相交核支持向量机(SVM),对待识别视频采用决策级加权融合的方法得到交互行为的识别结果。在标准数据库测试的结果表明,该方法简单有效,对交互行为的正确识别率达到了85%。
参考文献 | 相关文章 | 多维度评价
5. 基于改进时空兴趣点特征的双人交互行为识别
王佩瑶, 曹江涛, 姬晓飞
计算机应用    2016, 36 (10): 2875-2879.   DOI: 10.11772/j.issn.1001-9081.2016.10.2875
摘要387)      PDF (972KB)(411)    收藏
针对实际监控视频下双人交互行为的兴趣点特征选取不理想,且聚类词典中冗余单词导致识别率不高的问题,提出一种基于改进时空兴趣点(STIP)特征的交互行为识别方法。首先,引入基于信息熵的不可跟踪性检测方法,对序列图像进行跟踪得到交互动作的前景运动区域,仅在此区域内提取时空兴趣点以提高兴趣点检测的准确性。其次采用3维尺度不变特性转换(3D-SIFT)描述子对检测得到的兴趣点进行表述,利用改进的模糊C均值聚类方法得到视觉词典,以提升词典的分布特性;在此基础上建立词袋模型,即将训练集样本向词典进行投影得到每帧图像的直方图统计特征表示。最后,采用帧帧最近邻分类方法进行双人交互动作识别。在UT-interaction数据库上进行测试,该算法得到了91.7%的正确识别率。实验结果表明,通过不可跟踪性检测得到的时空兴趣点的改进词袋算法可以较大程度提高交互行为识别的准确率,并且适用于动态背景下的双人交互行为识别。
参考文献 | 相关文章 | 多维度评价
6. 光学遥感图像多目标检测及识别算法设计与实现
姬晓飞, 秦宁丽
计算机应用    2015, 35 (11): 3302-3307.   DOI: 10.11772/j.issn.1001-9081.2015.11.3302
摘要553)      PDF (936KB)(508)    收藏
针对目前光学遥感图像处理与分析多集中在单目标检测及识别领域的局限性,多目标检测及识别成为了一个非常值得关注的研究课题,提出了一种光学遥感图像多目标检测及识别算法.首先,采用自适应阈值算法对目标快速检测分割;然后,结合图像金字塔思想和基于尺度不变特征变换的特征包(BoF-SIFT)特征提出了一种分层的BoF-SIFT特征表示目标的全局特征和局部特征,详细地描述了目标的分布特性;最后,采用基于径向基核函数的支持向量机为弱分类器的AdaBoost算法,经过不断更新权重之后得到一个强分类器对待测试目标图像完成分类识别,识别率达到了93.52%.实验结果表明,所提算法对多类遥感图像目标的分割效果显著,特征选取恰当,识别方法快速有效.
参考文献 | 相关文章 | 多维度评价